场景分类已确定为一个具有挑战性的研究问题。与单个对象的图像相比,场景图像在语义上可能更为复杂和抽象。它们的差异主要在于识别的粒度水平。然而,图像识别是场景识别良好表现的关键支柱,因为从对象图像中获得的知识可用于准确识别场景。现有场景识别方法仅考虑场景的类别标签。但是,我们发现包含详细的本地描述的上下文信息也有助于允许场景识别模型更具歧视性。在本文中,我们旨在使用对象中编码的属性和类别标签信息来改善场景识别。基于属性和类别标签的互补性,我们提出了一个多任务属性识别识别(MASR)网络,该网络学习一个类别嵌入式,同时预测场景属性。属性采集和对象注释是乏味且耗时的任务。我们通过提出部分监督的注释策略来解决该问题,其中人类干预大大减少。该策略为现实世界情景提供了更具成本效益的解决方案,并且需要减少注释工作。此外,考虑到对象检测到的分数所指示的重要性水平,我们重新进行了权威预测。使用提出的方法,我们有效地注释了四个大型数据集的属性标签,并系统地研究场景和属性识别如何相互受益。实验结果表明,与最先进的方法相比
translated by 谷歌翻译
Artificial intelligence is set to be deployed in operating rooms to improve surgical care. This early-stage clinical evaluation shows the feasibility of concurrently attaining real-time, high-quality predictions from several deep neural networks for endoscopic video analysis deployed for assistance during three laparoscopic cholecystectomies.
translated by 谷歌翻译
我们研究了合作航空航天车辆路线应用程序的资源分配问题,其中多个无人驾驶汽车(UAV)电池容量有限和多个无人接地车辆(UGV),这也可以充当移动充电站,需要共同实现诸如持续监视一组要点之类的任务。由于无人机的电池能力有限,他们有时必须偏离任务才能与UGV进行集合并得到充电。每个UGV一次可以一次提供有限数量的无人机。与确定性多机器人计划的先前工作相反,我们考虑了无人机能源消耗的随机性所带来的挑战。我们有兴趣找到无人机的最佳充电时间表,从而最大程度地减少了旅行成本,并且在计划范围内没有任何无人机在计划范围内取消收费的可能性大于用户定义的公差。我们将此问题({风险意识召集集合问题(RRRP))}作为整数线性程序(ILP),其中匹配的约束捕获资源可用性约束,而背包约束捕获了成功概率约束。我们提出了一种求解RRRP的双晶格近似算法。在一个持续监测任务的背景下,我们证明了我们的制定和算法的有效性。
translated by 谷歌翻译
我们提出了一种基于图的基于图的方法,用于标记给定的气道树分割的解剖学分支。该方法在气道树图中制定了气道标记作为分支分类问题,其中使用卷积神经网络(CNN)提取分支特征,并使用图形神经网络富集。我们的图形神经网络是通过从其本地邻居的每个节点聚合信息来实现的结构感知,并通过编码图中的节点位置来定位。我们在来自慢性阻塞性肺病(COPD)的各种严重阶段的受试者的220个气道树上评估了该方法。结果表明,我们的方法是计算上高效的,并且显着提高了分支分类性能而不是基线方法。与标准CNN方法获得的83.83 \%相比,我们的方法的总体平均精度达到91.18 \%。我们在https://github.com/diagnijmegen/spgnn发布了我们的源代码。该算法还在HTTPS://grand-Challenge.org/algorithms/airway-anatomical-labeling/上公开使用。
translated by 谷歌翻译
胸腔CT上的自动病变分割能够快速定量分析Covid-19感染的肺部受累。然而,获得用于训练分割网络的大量体素级注释是非常昂贵的。因此,我们提出了一种基于密集回归激活地图(DRAM)的弱监督分割方法。大多数弱监督的分割方法接近利用类激活映射(CAM)到本地化对象。但是,由于凸轮培训进行分类,因此它们不会与对象分割精确对齐。相反,我们使用来自培训的分割网络的密集特征生成高分辨率激活映射,以训练为估计每瓣病变百分比。以这种方式,网络可以利用关于所需病变卷的知识。此外,我们提出了一个注意神经网络模块,以优化DRAM,与主要回归任务一起优化。我们在90个科目中评估了我们的算法。结果表明,我们的方法达到了70.2%的骰子系数,显着优于凸轮基基线48.6%。
translated by 谷歌翻译